上下文:测试气味是开发测试用例时采用的亚最佳设计选择的症状。先前的研究证明了它们对测试代码可维护性和有效性的有害性。因此,研究人员一直在提出基于启发式的自动化技术来检测它们。但是,此类探测器的性能仍然有限,并且取决于要调整的阈值。目的:我们提出了基于机器学习来检测四种测试气味的新型测试气味检测方法的设计和实验。方法:我们计划开发最大的手动验证测试气味数据集。该数据集将被利用来训练六个机器学习者,并在跨项目内和跨项目内评估其功能。最后,我们计划将我们的方法与最新的基于启发式的技术进行比较。
translated by 谷歌翻译
Large Language Models (LLMs) have been the subject of active research, significantly advancing the field of Natural Language Processing (NLP). From BERT to BLOOM, LLMs have surpassed state-of-the-art results in various natural language tasks such as question answering, summarization, and text generation. Many ongoing efforts focus on understanding LLMs' capabilities, including their knowledge of the world, syntax, and semantics. However, extending the textual prowess of LLMs to symbolic reasoning has been slow and predominantly focused on tackling problems related to the mathematical field. In this paper, we explore the use of LLMs for automated planning - a branch of AI concerned with the realization of action sequences (plans) to achieve a goal, typically executed by intelligent agents, autonomous robots, and unmanned vehicles. We introduce Plansformer; an LLM fine-tuned on planning problems and capable of generating plans with favorable behavior in terms of correctness and length with reduced knowledge-engineering efforts. We also demonstrate the adaptability of Plansformer in solving different planning domains with varying complexities, owing to the transfer learning abilities of LLMs. For one configuration of Plansformer, we achieve ~97% valid plans, out of which ~95% are optimal for Towers of Hanoi - a puzzle-solving domain.
translated by 谷歌翻译
TMIC是一种应用程序发明家扩展,用于部署ML模型,以在教育环境中使用Google Tochable Machine开发的图像分类。 Google Thotable Machine是一种直观的视觉工具,可为开发用于图像分类的ML模型提供面向工作流的支持。针对使用Google Tochable Machine开发的模型的使用,扩展TMIC可以作为App Inventor的一部分,以tensorflow.js为tensorflow.js导出的受过训练的模型,这是最受欢迎的基于块的编程环境之一,用于教学计算计算K-12。该扩展名是使用基于扩展图片的App Inventor扩展框架创建的,可在BSD 3许可下获得。它可用于在K-12中,在高等教育的入门课程中或有兴趣创建具有图像分类的智能应用程序的任何人。扩展TMIC是由Initiative Computa \ c {C} \ 〜Ao Na Escola的信息学和统计系的圣卡塔纳纳大学/巴西大学提供的研究工作的一部分,旨在在K-中引入AI教育。 12。
translated by 谷歌翻译
已被广泛提出规范作为一种协调和控制多助理系统(MAS)的代理活动的方式。规范指定代理人应遵循的行为以实现MAS的目标。然而,实现特定系统目标的设计规范可能是困难的,特别是当没有所说的系统目标的语言之间没有直接链接以及可以表达规范的语言时。在本文中,我们考虑从代理行为的痕量痕量综合综合标准的问题,其中每条迹线都标记了该行为是否满足系统目标。我们表明规范合成问题是NP完整的。
translated by 谷歌翻译
Covid-19的早期检测对于控制其扩散至关重要。已经提出了深度学习方法,以检测来自胸部CT图像的Covid-19的暗示迹象。但是,由于疾病的新颖性,注释的体积数据稀缺。在这里,我们提出了一种不需要大的注释数据集或反向化来估计卷积神经网络(CNN)的过滤器的方法。对于几个CT图像,用户在代表性正常和异常区域上绘制标记。该方法生成由一系列卷积层组成的特征提取器,其内核专用于增强与标记的区域,并且我们的CNN的决策层是支持向量机。由于我们无法控制CT图像采集,我们还提出了一种强度标准化方法。我们的方法可以在数据集中达到0.97美元和0.93美元的平均准确性和κ值,其中包含来自不同站点的117个CT图像,超越了所有场景的对应物。
translated by 谷歌翻译